Image super-resolution is a common task on mobile and IoT devices, where one often needs to upscale and enhance low-resolution images and video frames. While numerous solutions have been proposed for this problem in the past, they are usually not compatible with low-power mobile NPUs having many computational and memory constraints. In this Mobile AI challenge, we address this problem and propose the participants to design an efficient quantized image super-resolution solution that can demonstrate a real-time performance on mobile NPUs. The participants were provided with the DIV2K dataset and trained INT8 models to do a high-quality 3X image upscaling. The runtime of all models was evaluated on the Synaptics VS680 Smart Home board with a dedicated edge NPU capable of accelerating quantized neural networks. All proposed solutions are fully compatible with the above NPU, demonstrating an up to 60 FPS rate when reconstructing Full HD resolution images. A detailed description of all models developed in the challenge is provided in this paper.
translated by 谷歌翻译
非负矩阵分解(NMF)广泛用于聚类,具有强大的解释性。在一般的NMF问题中,对称NMF是一个特殊的问题,它在图形聚类中起着重要作用,其中每个元素都测量数据点之间的相似性。大多数现有的对称NMF算法都需要因子矩阵为非负数,并且仅着眼于最大程度地减少原始矩阵之间的差距及其进行聚类的近似值,而无需考虑其他潜在的正则化项,从而产生更好的聚类。在本文中,我们探索以分解不必不需要的对称矩阵,并具有带有正则化项的有效分解算法以提高聚类性能。此外,提出了一个更普遍的框架来解决对称矩阵的对称矩阵分解问题,并在因子矩阵上限制了不同。
translated by 谷歌翻译
将异常检测外包给第三方可以允许数据所有者克服资源限制(例如,在轻量级的IoT设备中),促进协作分析(例如,分布式或多方场景下的分布式或多方场景),并受益于较低的成本和专业知识(例如托管安全服务提供商)。尽管有这样的好处,但数据所有者可能会不愿外包异常检测而没有足够的隐私保护。为此,大多数现有的隐私解决方案将面临新的挑战,即保留隐私通常需要消除或减少数据条目之间的差异,而异常检测严重取决于该差异。最近,在本地分析设置下,通过将差异隐私(DP)保证的重点从“全部”到“良性”条目移动,这一冲突是在本地分析设置下解决的。在本文中,我们观察到这种方法不直接适用于外包设置,因为数据所有者在外包之前不知道哪些条目是“良性”的,因此无法选择地将DP应用于数据条目。因此,我们提出了一种新型的迭代解决方案,使数据所有者逐渐“脱离”良性条目的异常条目,以便第三方分析师可以通过足够的DP保证产生准确的异常结果。我们设计并实施了我们对异常检测(DPOAD)框架的差异私人外包,并通过从不同应用域中的真实数据进行实验,证明了其比基线拉普拉斯和无止痛机制的好处。
translated by 谷歌翻译
对象异常的检测对于工业过程至关重要,但是由于难以获得大量有缺陷的样本以及现实生活中无法预测的异常类型,因此无监督的异常检测和定位尤为重要。在现有的无监督异常检测和定位方法中,基于NF的方案取得了更好的结果。但是,两个子网(复杂函数)$ s_ {i}(u_ {i})$和$ t_ {i}(u_ {i})在nf中通常是多层的perceptrons,需要从2D扁平至1D,破坏了特征图中的空间位置关系并丢失空间结构信息。为了保留并有效提取空间结构信息,我们在这项研究中设计了一个复杂的函数模型,该模型具有交替的CBAM嵌入在堆叠的$ 3 \ times3 $全卷积中,该卷积能够保留并有效地在标准化流程模型中提取空间结构信息。 MVTEC AD数据集的广泛实验结果表明,Cainnflow基于CNN和Transformer Backbone网络作为特征提取器达到高级准确性和推理效率,并且Cainnflow可在MVTEC广告中获得$ 98.64 \%的像素级AUC $ 98.64 \%\%。
translated by 谷歌翻译
随着互联网技术的发展,信息超载现象变得越来越明显。用户需要花费大量时间来获取所需的信息。但是,汇总文档信息的关键词非常有助于用户快速获取和理解文档。对于学术资源,大多数现有研究通过标题和摘要提取关键纸张。我们发现引用中的标题信息还包含作者分配的密钥次。因此,本文使用参考信息并应用两种典型的无监督的提取方法(TF * IDF和Textrank),两个代表传统监督学习算法(NA \“IVE贝叶斯和条件随机场)和监督的深度学习模型(Bilstm- CRF),分析参考信息对关键症提取的具体性能。从扩大源文本的角度来提高关键术识别的质量。实验结果表明,参考信息可以提高精度,召回和F1自动关键肾上腺瓶在一定程度上提取。这表明了参考信息关于学术论文的关键症提取的有用性,并为以下关于自动关键正萃取的研究提供了新的想法。
translated by 谷歌翻译
风险的准确器官(OAR)分割对于减少治疗后并发症的放射治疗至关重要。达人指南推荐头部和颈部(H&N)区域的一套超过40桨的桨,然而,由于这项任务的可预测的禁止劳动力成本,大多数机构通过划定较小的桨子和忽视的少数,选择了大量简化的协议与其他桨相关的剂量分布。在这项工作中,我们提出了一种使用深度学习的新颖,自动化和高效的分层OAR分段(SOARS)系统,精确地描绘了一套全面的42 H&N OAR。 SOARS将42桨分层进入锚,中级和小型和硬质子类别,通过神经结构搜索(NAS)原则,专门为每个类别提供神经网络架构。我们在内在机构中使用176名培训患者建立了SOAR模型,并在六个不同的机构中独立评估了1327名外部患者。对于每个机构评估,它始终如一地表现出其他最先进的方法至少3-5%的骰子得分(在其他度量的相对误差减少36%)。更重要的是,广泛的多用户研究明显证明,98%的SOARE预测只需要非常轻微或没有直接临床验收的修订(节省90%的辐射脑神经工作负载),并且它们的分割和剂量准确度在于或小于帧 - 用户的变化。这些调查结果证实了H&N癌症放射疗法工作流OAR描绘过程的强烈临床适用性,提高了效率,全面性和质量。
translated by 谷歌翻译
Pretraining is a dominant paradigm in computer vision. Generally, supervised ImageNet pretraining is commonly used to initialize the backbones of person re-identification (Re-ID) models. However, recent works show a surprising result that CNN-based pretraining on ImageNet has limited impacts on Re-ID system due to the large domain gap between ImageNet and person Re-ID data. To seek an alternative to traditional pretraining, here we investigate semantic-based pretraining as another method to utilize additional textual data against ImageNet pretraining. Specifically, we manually construct a diversified FineGPR-C caption dataset for the first time on person Re-ID events. Based on it, a pure semantic-based pretraining approach named VTBR is proposed to adopt dense captions to learn visual representations with fewer images. We train convolutional neural networks from scratch on the captions of FineGPR-C dataset, and then transfer them to downstream Re-ID tasks. Comprehensive experiments conducted on benchmark datasets show that our VTBR can achieve competitive performance compared with ImageNet pretraining - despite using up to 1.4x fewer images, revealing its potential in Re-ID pretraining.
translated by 谷歌翻译
As an efficient graph analytical tool, graph neural networks (GNNs) have special properties that are particularly fit for the characteristics and requirements of wireless communications, exhibiting good potential for the advancement of next-generation wireless communications. This article aims to provide a comprehensive overview of the interplay between GNNs and wireless communications, including GNNs for wireless communications (GNN4Com) and wireless communications for GNNs (Com4GNN). In particular, we discuss GNN4Com based on how graphical models are constructed and introduce Com4GNN with corresponding incentives. We also highlight potential research directions to promote future research endeavors for GNNs in wireless communications.
translated by 谷歌翻译
作为图形数据的有效神经网络模型,图形神经网络(GNN)最近找到了针对各种无线优化问题的成功应用程序。鉴于GNN的推理阶段可以自然地以分散的方式实施,因此GNN是下一代无线通信中分散控制/管理的潜在推动力。但是,由于在与GNN的分散推断期间,邻居之间的信息交流可能会发生隐私泄漏。为了解决这个问题,在本文中,我们分析并增强了无线网络中GNN分散推断的隐私。具体来说,我们采用当地的差异隐私作为指标,设计了新颖的隐私信号以及隐私保证的培训算法,以实现保护隐私的推论。我们还定义了SNR私人关系权衡功能,以分析无线网络中使用GNN的分散推理的性能上限。为了进一步提高沟通和计算效率,我们采用了空中计算技术,理论上证明了其在隐私保护方面的优势。通过对合成图数据的大量模拟,我们验证了理论分析,验证提出的隐私无线信号传导和隐私保证培训算法的有效性,并就实际实施提供一些指导。
translated by 谷歌翻译
经验重播是深入增强学习(DRL)的重要组成部分,它可以存储经验并为代理商实时学习的经验。最近,优先的经验重播(PER)已被证明是强大的,并且在DRL代理中已广泛部署。但是,由于其频繁和不规则的内存访问,在传统的CPU或GPU架构上实施会造成大量的延迟开销。本文提出了一种硬件软件共同设计方法,以设计基于AMPER的相关内存(AM),并具有AM友好的优先采样操作。 Amper在保留学习绩效的同时,以PER中的Per取代了广泛使用的时间成本的基于Tree-Traversal的优先级抽样。此外,我们设计了基于AM的内存计算硬件体系结构,以通过利用并行的内存搜索操作来支持安珀。与GPU上的每次运行相比,Amper在在拟议的硬件上运行时,在拟议的硬件上运行55倍至270倍的延迟延迟时,显示出可比的学习表现。
translated by 谷歌翻译